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摘 要 常用 的 结构 方程 模型 拟 合 指数 存在 一 定局 限 ， 如 x 以 传统 零 假设 为 目标 假设 , 无 法 
验证 模型 , 而 RMSEA 和 CFI 等 描述 性 的 拟 合 指数 不 具备 推断 统计 性 质 ,等 效 性 检验 有 效 弥 


补 了 这 些 问 题 。 首 先 说 明 等 效 性 检验 如 何 评价 单个 模型 的 拟 合 
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完 中 心 ， 


同 , 然后 介绍 等 效 性 检验 如 何 分 析 测 量 不 变性 , 接着 用 实证 数据 展示 了 等 效 性 检验 在 单个 模 
型 评价 和 测量 不 变性 检验 中 的 效果 ， 并 与 传统 模型 评价 方法 比较 。 
关键 词 ”结构 方程 模型 ， 拟 合 指数 ， 等 效 性 检验 ， 零 假设 检验 ; 测量 不 变性 
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在 心理 学 、 


a 


理学 等 社会 科学 研究 领域 ， 结 构 方程 模型 (Structural Equation Model, SEM) 


是 一 种 重要 的 统计 工具 ， 它 能 够 更 好 地 控制 测量 误差 ， 并 同时 构建 复杂 的 多 变量 模型 ， 从 而 


帮助 研究 者 获得 比 一 般 回归 分 析 更 加 准确 的 分 析 结 果 。 结 构 方程 建 模 的 一 个 关键 步骤 是 评价 


模型 拟 合 ， 因 为 对 模型 有 关 参 数 的 估计 要 以 良好 模型 拟 合 为 前 提 。 如 果 模 型 拟 合 不 佳 ， 即 理 


论 模 型 为 误 设 模型 ， 则 建立 在 此 模型 之 上 的 参数 估计 (如 因子 载荷 、 路 径 系数 及 基于 模型 的 


信 度 指标 等 ) 结 果 都 是 不 可 靠 的 。 


尽管 模型 拟 合 至 关 重 要 , 但 当前 通用 的 模型 拟 合 评价 标准 尚 存 一 些 不 足 。 已 有 的 模型 拟 
合 指数 可 分 两 类 (Marcoulides & Yuan, 2017)。 一 类 是 描述 性 的 ， 最 常用 的 是 


(Lai, 2020)。 很 多 研究 者 通过 简单 报告 RMSEA 和 CFI 估计 值 并 将 其 与 一 个 经 验 临界 值 比较 


来 文 持 他 们 的 模型 。 这 个 过 程 不 涉及 显著 性 检验 ， 就 不 知道 折 


HK 


怎样 的 拟 合 指 数 才 是 可 以 接受 的 (McNeish et al., 2018); 5j 


差 值 检验 (用 于 藤 套 模型 比较 和 测量 不 变性 检验 )， 可 以 通过 显 


RMSEA 和 CFI 


上 晰 错误 的 概率 ， 因 此 很 难 确定 
类 是 推断 性 的 ， 如 总 检验 和 和 2 
著 性 检验 来 评价 模型 拟 合 好 


十。 然而, ?存在 很 多 问题 。 通 常 的 统计 检验 都 是 将 想 要 验证 的 假设 作为 备 择 假 设 ， 关 统计 
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显著 ， 拒 绝 零 假设 接受 备 择 假 设 时 知道 犯错 误 ( 即 第 一 类 错误 ) 的 概率 ( 即 显著 性 水 平 )， 但 模 
型 拟 合 如 检验 却 将 想 要 验证 的 假设 作为 零 假 设 ， 统 计 不 显著 接受 零 假设 时 犯错 误 ( 即 第 二 类 
错误 ) 的 概率 通常 都 比较 大 ， 而 且 还 不 知道 有 多 大 ， ?检验 无 法 真正 起 到 验证 模型 的 作用 。 

为 改善 上 述 模型 拟 合 评价 标准 的 不 足 ， 研 究 者 提出 将 等 效 性 检验 (Equivalence Testing, 


ET) 用 于 结构 方程 模型 评价 (Yuan & Chan, 2016; Yuan et al., 2016)。 该 方法 一 方面 修正 了 ? 检 
验 的 问题 ， 另 一 方面 ， 将 推断 统计 元 素 融 入 了 CFI 和 RMSEA， 可 以 用 于 单个 模型 拟 合 评 价 
和 测量 不 变性 检验 ， 已 经 得 到 了 越 来 越 多 的 关注 和 应 用 (如 Alpizar, 2020; Fu et al., 2018; 


Swami & Barron, 2019; Tóth-Király et al., 2018; Wang et al., 2020)。 本 文 介绍 等 效 性 检验 如 何 
用 于 单个 模型 评价 和 测量 不 变性 检验 , 然后 进行 实例 演示 , 最 后 对 相关 问题 进行 了 讨论 和 拓 
展 。 


m 


2 等 效 性 检验 用 于 评价 单个 模型 拟 合 

拟 合 函数 FlS, 2(O)] 是 结构 方程 模型 评价 的 一 个 重要 概念 ， 它 代表 了 样本 协 方差 矩阵 S 
与 假设 模型 隐 含 的 协 方差 矩阵 2(O) 的 距离 。 应 用 研究 者 也 可 以 简单 地 理解 为 $ 代表 实际 数据 
所 反映 的 变量 关系 ，ZO 代 表 我 们 假设 的 变量 关系 ， 拟 合 函 数 衡量 了 变量 关系 在 假设 模型 与 
实际 数据 中 的 差距 ( 吴 明 隆 , 2010)。 利 用 特定 的 算法 (如 极 大 似 然 估 计 )， 可 以 求 得 一 个 使 拟 合 
函数 Fil S, (0)] 达 到 最 小 值 的 9 估计 值 ， 这 个 拟 合 函数 的 最 小 值 用 Fm ZI F mo 为 Fm 对 应 
的 总 体 真 值 ， 即 (9) 与 真 模型 协 方差 矩阵 > 的 最 小 距离 。 在 很 一 般 的 条 件 下 ， 随 着 样本 容量 
RK, Fm WORF Fn( 温 忠 蚀 等 ,2012)。 对 于 错误 设 定 的 模型 ，Fo>0， 它 的 取 值 反映 了 误 
设 大 小 ， 此 时 似 然 比 统计 量 Tx( 即 前 文 提 到 的 局 检 验 统计 量 =(N-1)Fm 近 似 服从 一 个 非 中 心 
4L. I FR 23 4) (0), 其 自由 度 4 上 三 p(p+1)/2-q;p 是 显 变 量 个 数 ,gqg 是 


参数 个 数 ; O=(N-1)Finio 


是 非 中 心 参数 (Noncentrality Parameter); 如 果 模 型 正确 设 定 ， 即 Fo=0，Tm 服 从 一 个 中 心 化 
HESA iy ó-0(Yuan et al., 2016). 

各 检验 的 传统 零 假 设 为 : Ho: Fno=0 S Ho: E-X(0s 而 对 于 等 效 性 检验 ， 零 假设 变 
Jj: Hoa: Fmio>éo (Yuan et al.,2016)。so 是 一 个 小 正 数 ， 代 表 一 个 由 研究 者 预先 设 定 的 可 以 容 
忍 的 误 设 程度 ,等 效 性 检验 的 零 假 设 也 可 以 用 非 中 心 参数 表示 , 即 : Hoa: 0700; 其 中 560=(N-1)eo。 
令 ca(e0) 为 等 效 性 检验 的 零 假设 分 布 x?(60) 在 a 水 平 (默认 取 0.05) 的 左 侧 临界 值 ， 如 果 
Tm<ca(s0)， 我 们 拒绝 零 假设 Hoo WIEN Fw 代表 的 模型 误 设 水 平 不 大 于 eo， 模型 可 以 接受 ， 
做 出 这 一 推断 犯错 误 的 概率 控制 在 a 水 平 (Jiang et al., 2017)， 也 可 以 等 价 表述 为 有 95% 的 置 


信 度 认为 模型 可 以 接受 。 除 了 将 Tint 和 cs(s0) 相 比较 , 我 们 还 可 以 利用 类 似 p 值 的 统计 量 来 评 
价 等 效 性 检验 的 结果 : 定义 一 个 统计 量 g, 计算 满足 公式 Tuc«e)l)es 对 于 任何 小 于 go 的 gi， 
我 们 都 可 以 拒绝 Hos, 接受 模型 , 并 且 这 一 推断 的 错误 率 不 超过 wa(Marcoulides & Yuan, 2017). 


这 里 的 se 可 以 称 之 为 最 大 可 容忍 误 设 (Maximum Tolerable Size of Model Misspecification)， 扮 
演 了 一 个 类 似 于 p 值 却 又 有 所 不 同 的 角色 。 说 相似 是 因为 s; 也 通过 和 一 个 临界 点 比较 来 判断 
否 接 受 模型 ， 说 不 同 是 因为 p 值 是 和 显著 性 水 平 a 相 比 ， 得 到 的 结论 是 统计 上 是 否 显 著 ， 
而 gs: 是 在 统计 显著 的 前 提 下 ， 与 一 个 代表 误 设 微不足道 的 临界 点 ao 相 比较 。 这 样 ，s, 所 提供 
的 信息 量 比 p 值 还 要 大 , 它 不 仅 说 明 统计 显著 , 还 说 明 误 设 程度 的 效应 足够 小 。 所 以 更 准确 

地 说 ，g 是 显著 性 检验 和 效应 量 的 结合 体 。 
对 于 等 效 性 检验 ， 临 界 点 so 的 选择 对 分 析 至 关 重要 (Counsell et al., 2020); 因此 需要 有 一 


| 个 选择 eo 的 标准 。 为 避免 选择 过 于 随意 、 主 观 , 可 以 通过 公式 eo=dKRMSEAoj: iBeo fll RMSEA 
zr 关联 起 来 (Yuan et al., 2016)， 并 选择 RMSEA0=0.08 作为 模型 误 设 可 以 接受 的 经 验 临界 值 ， 从 
= TADE 25 ML Eeo KE, RENT VELA Re-dARMSEA)? fc, 和 RMSEA 关联 起 
K, 定义 一 个 RMSEA, 蔡 代 s: 的 作用 ， 它 不 仅 可 以 说 明 模型 拟 合 程度 或 误 设 程度 大 小 ， 
断 犯 错误 的 概率 不 超过 xc， 从 而 使 RMSEA 具备 了 过 去 没有 的 统计 推断 性 质 。 从 Tzrcevs(e) 这 
© 个 方程 可 知 ，g& 就 是 Fmo=d/(N-1)AY 1-2x 置 信 区 间 的 上 限 ， 而 RMSEA, 是 RMSEA 的 1-2 8 


信 区 间 的 上 限 (Yuan et al., 2016)。 由 于 RMSEA 的 90% 置 信 区 间 是 Mplus 软件 的 默认 输出 结 


果 ， 在 评价 单个 模型 拟 合 时 ， 我 们 可 以 直接 在 Mplus 中 读 取 RMSEA 90% 置 信 区 间 上 限 值 ， 


就 获取 了 RMSEA,， 十 分 方便 。 然 后 将 RMSEA, 和 RMSEA 0=0.08 相 比 较 ， 如 果 RMSEA, 不 
大 于 0.08， 我 们 可 以 接受 模型 ， 并 声明 以 RMSEA 作为 模型 误 设 评价 指标 时 ， 模 型 误 设 不 超 
过 RMSEA,， 这 一 推断 犯错 误 的 概率 不 超过 0.05; 如 果 RMSEA, 大 于 0.08， 尽 管 我 们 仍 可 以 
以 9$% 的 置信 和 度 声 明 误 设 不 超过 RMSEA, 但 因为 RMSEA, 已 经 高 于 经 验 临 界 值 ， 无 法 接受 


模型 。 


3 等 效 性 检验 和 传统 零 假设 检验 的 比较 

等 效 性 检验 和 传统 的 零 假设 检验 的 异同 点 主要 表现 在 以 下 几 个 方面 (Yuan & Chan, 
2016): 首先 ,等 效 性 检验 和 零 假设 检验 都 用 7 作为 统计 量 ， 但 它们 的 零 假设 分 布 和 拒绝 域 
都 不 同 ， 等 效 性 检验 的 零 假设 假定 模型 存在 误 设 (大 于 so)， 所 以 对 应 一 个 非 中 心 化 的 卡 方 分 
fip). 35 Tw 落 在 区 间 [0, ca(eo)] 中 时 ， 拒 绝 零 假设 ， 认 为 模型 误 设 程度 可 以 接受 ， 零 假设 


检验 的 零 假设 假定 模型 误 设 为 0, FEAT AS R2 i?» 25 Tu VEE EX TED [ess o0] 
中 时 ， 拒 绝 零 假 设 ， 认 为 模型 为 误 设 模型 。cl-* 是 零 假 设 分 布 如 在 1-a 水 平 的 右 侧 临界 值 。 可 
见 ， 等 效 性 检验 和 零 假设 检验 的 作用 刚好 相反 ,前 者 适用 于 接受 模型 ,而 后 者 适用 于 拒绝 模 


第 二 , 尽管 名 义 上 第 一 类 错误 的 概率 大 小 都 为 a, 但 两 种 检验 的 第 一 类 错误 的 含义 不 同 。 
对 等 效 性 检验 而 言 ， 第 一 类 错误 是 指 将 一 个 不 可 接受 的 模型 ( 即 Fwo>e0) 判 定 为 可 接受 的 模 


型 ， 而 对 于 零 假设 检验 ， 第 一 类 错误 是 指 将 正确 设 定 的 模型 ( 即 Fw=0) 判 定 为 误 设 模型 ( 即 


Fno>0) 

第 三 , 在 一 定 条 件 下 , 零 假设 检验 和 等 效 性 检验 的 零 假 设 可 以 同时 被 接受 或 拒绝 ,但 意 
义 不 同 。 如 果 ca(eo) 小 于 cia， 且 观测 到 的 Ty 落 在 这 两 个 数字 之 间 ， 零 假设 检验 和 等 效 性 检 
验 的 零 假设 都 不 能 被 拒绝 ， 即 既 无 法 声明 模型 是 无 误 设 的 , 也 不 能 证 明 模 型 误 设 在 可 接受 范 
EA. WR ca(e0) 大 于 cia， 且 观测 到 的 Ty 落 在 这 两 个 数字 之 间 ， 我 们 可 以 同时 拒绝 零 假设 
检验 和 等 效 性 检验 的 零 假设 ， 即 模型 误 设 并 不 是 0， 但 在 一 个 可 接受 范围 内 。 

第 四 ， 由 于 cu(eo) 随 着 so 的 增加 而 增加 ， 将 会 存在 一 个 go 使 得 ca(g0) 刚 好 等 于 ciu. DET, 
等 效 性 检验 可 能 会 得 到 和 零 假 设 检验 一 样 的 结论 。 但 这 个 结果 的 意义 是 不 一 样 的 。 对 于 等 效 
性 检验 ， 在 ca(e0)=cia， 我们 可 以 认为 误 设 水 平 为 6o=Fw 是 可 以 接受 的 ; 但 对 于 零 假 设 检验 ， 
我 们 不 知道 当前 模型 的 误 设 有 多 大 。 


4 等 效 性 检验 用 于 测量 不 变性 分 析 
测量 不 变性 检验 是 结构 方程 模型 的 一 种 重要 应 用 ， 它 考察 了 问卷 的 结构 在 不 同情 景 中 
(如 不 同 群体 和 不 同时 间 ) 是 否 是 一 致 的 。 对 于 无 均值 结构 的 模型 ， 传 统 的 测量 不 变性 分 析 通 
常 可 以 按照 如 下 顺序 进行 : (1) 检验 两 个 组 有 无 相同 的 模型 结构 ， 即 因子 数 相同 和 因子 -条 目 
对 应 关系 相同 ， 也 称 形态 不 变性 (Configural Invariance); (2) 检 验 各 组 载荷 是 否 跨 组 不 变 ， 即 
A 


单位 不 变性 (Metric Invariance) 或 弱 不 变性 (Weak Invariance); (3) 检 验 各 组 条 目 误差 方差 是 否 
跨 组 不 变 ， 即 误差 方差 不 变性 (Error Variance Invariance)/ 严 格 不 变性 (Strict Invariance); (4) 检 
验 各 组 因子 方差 和 协 方差 是 否 跨 组 不 变 。 对 于 有 均值 结构 的 模型 , 可 以 在 单位 不 变性 检验 之 
后 ， 按 如 下 顺序 进行 分 析 : (3”) 检 验 各 组 条 目 截 距 是 否 跨 组 不 变 ， 即 截 距 不 变性 (Scalar 


Invariance) 或 强 不 变性 (Strong Invariance); (4”) 检 验 各 组 潜 均 值 是 否 跨 组 不 变 (Jiang et al., 


2017)。 


每 一 步 检 验 都 以 前 一 步 模型 成 立 为 前 提 , 否则 停止 分 析 。 模型 成 立 通常 可 以 依据 两 个 标 
准 : 其 一 ， 当 前 模型 与 前 一 步 模型 的 卡 方差 值 即 Ax? 统计 不 显著 ;其 二 ， 当 前 模型 与 前 一 步 
模型 的 CFI 或 RMSEA 差 值 即 ACFI 或 ARMSEA 足够 小 (Jin, 2020)。x?、CFI 和 RMSEA 理论 
上 的 不 足 前 文 已 有 说 明 ， 且 已 有 的 实证 和 模拟 研究 显示 ，Ax?、ACFI 及 ARMSEA 的 统计 学 
性 质 均 不 够 理想 。 以 错误 判定 不 变性 的 概率 作为 第 一 类 错误 率 、 以 正确 判定 不 变性 的 概率 作 


为 统计 检验 力 ，Ax?、ACFI 和 ARMSEA 的 第 一 类 错误 率 总 是 明显 偏 高 (Counsell et al., 2020; 


Finch & French, 2018; Yuan & Chan, 2016)， 特 别 是 样本 容量 偏 小 (如 小 于 250) 时 ， 最 大 可 达 
0.8 以 上 (Counsell et al., 2020). ACFI 还 有 个 额外 的 问题 ， 在 因子 载荷 较 高 时 ， 无 论 样本 容量 
多 大 , 它 的 第 一 类 错误 率 总 是 极 高 。 在 统计 检验 力 方面 ， Ax? 在 模型 完全 没有 误 设 ( 即 Fwo=0) 
时 ， 检 验 力 较 高 (Counsell et al., 2020; Finch & French, 2018; Yuan & Chan, 2016), xix 
况 不 切实 际 ; 而 在 更 现实 的 条 件 下 ， 即 当 模 型 存在 可 以 忽略 的 误 设 时 , 它 的 检验 力 会 随 着 样 
本 容量 增加 而 反常 地 下 降 (Counsell et al., 2020)。 相 较 于 这 些 传统 方法 ， 等 效 性 检验 第 一 类 错 
误 率 控制 很 精确 ， 基 本 上 稳定 在 0.05 水 平 ， 且 不 受 样本 容量 、 测 量 模型 和 因子 载荷 大 小 影 
响 ， 统 计 检 验 力 也 可 以 接受 (Counsell et al., 2020). 

在 测量 不 变性 分 析 中 ， 等 效 性 检验 的 零 假 设 为 : Heab: Fimiao-Fimibo>€0ab0 dab 代表 一 个 可 
以 接受 的 有 约束 模型 a 和 基准 模型 b 之 间 的 差 值 , 其 作用 和 单个 模型 评价 中 的 go 类 似 。 当 Ax 


tg 


ar 


估计 值 小 于 其 零 假设 分 布 x2, (Sonn) HAE MUM FUELS (Oo (N-m eos)» 我 们 拒绝 Hears 并 以 1-a 


m 


的 置信 度 声 明 由 模型 a OR SEH R EASE eos (Jiang et al., 2017)。 同 样 地 ， 我 们 也 
可 以 利用 ge 或 RMSEA, 代 蔡 疡 值 来 进行 统计 推断 。 除 了 测量 不 变性 分 析 这 种 藤 套 模型 比较 的 
© 特例 ， 等 效 性 检验 也 可 以 拓展 应 用 在 任何 嵌 套 模型 的 比较 中 。 

为 了 便于 研究 者 通过 等 效 性 检验 实现 测量 不 变性 分 析 ，Jiang 等 人 (2017) 编 写 了 R 程序 
包 equaltestMI。 除了 利用 到 测量 学 性 质 更 好 的 等 效 性 检验 之 外 ,equaltestMI 还 具备 两 个 突出 
优势 : (1) 传 统 的 测量 不 变性 分 析 中 每 个 约束 模型 都 要 建 模 一 次 (如 用 Mplus 进行 不 变性 分 
Br» Awe BBA AWE, Tht equaltestMI 利用 原始 数据 (包括 问卷 条 目 和 分 组 变量 ) 和 一 
个 简单 的 验证 性 因子 分 析 模 型 设 定 ， 即 可 一 次 性 输出 测量 不 变性 的 每 一 步 分 析 ， 十 分 方便 ， 
而 且 既 有 传统 测量 不 变性 分 析 的 结果 , 也 有 基于 等 效 性 检验 的 分 析 结 果 , 利于 研究 者 对 比 两 
种 方法 的 结果 。 

(2) 传 统 的 测量 不 变性 分 析 中 ， 均 值 结构 涉及 截 距 项 和 潜 均 值 。 截 距 项 需要 设 为 跨 组 不 
变 的 ， 从 而 使 得 潜 均 值 可 以 被 识别 和 估计 。 即 潜 均 值 不 变性 以 截 距 不 变 为 前 提 。 然 而 ,， 有 研 
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究 者 指出 这 在 理论 上 是 不 必要 的 (Jiang et al., 2017)， 现 实 中 截 距 不 变 也 很 难 满足 ( 王 孟 成 ， 


2014; Swami & Barron, 2019)。equaltestMI 利用 Deng 和 Yuan (2016) 提 出 的 投影 法 (Projection 
Method) 解 决 了 这 个 问题 。 投 影 法 将 每 个 组 的 显 变量 均值 分 解 为 两 个 正 交 的 成 分 :公分 数 
(Common Scores) 和 特殊 因子 (Specific Factors)。 检 验 公 分 数 均 分 的 跨 组 不 变性 本 质 上 是 检验 
潜 均 值 的 跨 组 不 变性 ,而 检验 特殊 因子 均 分 的 跨 组 不 变性 和 截 距 不 变性 有 关 , 但 不 一 样 。 公 
因子 和 特殊 因子 均 分 仅 依赖 于 样本 均值 和 估计 出 的 公 因 子 载荷 矩阵 ,不 会 涉及 到 截 距 项 ,所 
以 使 用 投影 法 就 可 以 在 不 要 求 显 变量 截 距 不 变 的 前 提 下 比较 潜 均 值 , 只 需要 满足 载荷 跨 组 不 
变 即 可 , 简化 了 测量 潜 均 值 不 变性 分 析 的 步 又 。 更 详细 的 原理 介绍 请 见 附录 或 Deng 和 Yuan 
(2016)。 注 意 : 投影 法 既 可 以 用 于 等 效 性 检验 ， 也 可 以 用 于 传统 测量 不 变性 分 析 。 


5 应 用 实例 

下 面 用 一 个 例子 演示 如 何 利用 等 效 性 检验 评价 单个 模型 拟 合 及 测量 不 变性 ,示例 样本 为 
856 名 大 学 生 , 男 487 A, 女 369 人 。 统计 软件 采用 Mplus 8.3 和 及 3.5.1 的 
句 示例 见 附录 )。 所 有 被 调查 者 完成 由 王 阳 等 人 (2017) 修 订 的 共 情 量 表 ， 该 量 表 共 8 ARH, 
包含 2 个 维度 : 认 知 共 情 ( 理 解 他 人 情绪 ) 和 情绪 共 情 (体验 到 他 人 情绪 ; Wang et al., 2019)。 每 
个 维度 有 4 个 条 目 。 首 先 评价 共 情 量 表 的 两 因子 模型 。 传 统 的 拟 合 指数 RMSEA=0.046。 等 
效 性 检验 结果 显示 RMSEA=0.061。 虽 然 两 种 方法 看 起 来 都 说 明 模 型 可 以 接受 (如 果 以 0.08 
为 临界 值 )， 但 对 于 前 者 ， 我 们 无 法 获取 有 关 推 断 犯 错误 概率 的 信息 ， 不 知道 是 否 模型 是 正 
= 确 设 定 的 ， 如 果 存 在 误 设 ， 也 不 知道 误 设 的 程度 (Marcoulides & Yuan, 2017); 而 等 效 性 检验 
G 不 仅 告诉 我 们 ， 当 以 RMSEA 衡量 模型 误 设 时 ， 模 型 误 设 程度 不 超过 0.061， 按 照 传统 临界 

值 ， 模 型 的 拟 合 可 以 接受 。 还 告诉 我 们 做 出 这 一 推断 犯错 误 的 概率 不 超过 5% 

接 下 来 进行 跨 性 别 测量 不 变性 分 析 , 由 于 很 多 时 候 研究 者 对 误差 方差 的 不 变性 不 感 兴趣 
( 王 孟 成 , 2014, Svetina et al., 2020; Swami & Barron, 2019)， 我 们 按照 形态 不 变性 一 单位 不 变 
性 一 截 距 不 变性 一 潜 均 值 不 变性 的 顺序 进行 分 析 ( 结 果 见 表 1)。 对 于 形态 不 变性 ， 单 独 用 ! 
生 和 女生 样本 拟 合 数据 ， 结 果 RMSEA 和 CFI 都 可 以 接受 ， 传 统 方法 支持 形态 不 变性 ; 
RMSEA 二 0.068、0.073， 表 明 对 于 男生 和 女生 样本 ,我 们 有 95% 的 置信 度 认为 模型 误 设 分 别 
不 超过 0.068 和 0.073， 等 效 性 检验 支持 形态 不 变性 。 对 于 单位 不 变性 和 截 距 不 变性 模型 ， 
传统 方法 的 ARMSEA 和 ACEFI 均 小 于 0.01，Ax? 也 不 显著 ， 传 统 方法 支持 单位 不 变性 和 截 距 
不 变性 ; 单位 不 变性 和 截 距 不 变性 对 应 的 RMSEA, 分 别 为 0.074 和 0.043， 我 们 有 95% 的 置 


equaltestMI 包 ( 语 


IT 


信和 度 认为 施加 载荷 相等 限制 和 施加 截 距 相 等 限制 造成 的 误 设 程度 各 自 不 超过 0.074 和 0.043, 
等 效 性 检验 也 支持 单位 不 变性 和 截 距 不 变性 。 对 于 潜 均 值 不 变性 ，ARMSEA 和 ACFI 均 小 于 
0.01，Ax? 也 不 显著 ， 传 统 方法 支持 潜 均 值 不 变性 ， 而 RMSEA=0.130, RITA 95% 的 置信 
度 认为 施加 潜 均 值 相等 限制 造成 的 误 设 程度 不 超过 0.130， 这 个 值 已 经 超过 拟 合 可 以 接受 的 
经 验 临 界 值 0.08( 温 忠 鹿 等, 2018)， 这 样 等 效 性 检验 未 支持 潜 均 值 不 变性 ， 除 非 我 们 可 以 接 


受 最 大 为 0.130 的 误 设 。 


表 1 测量 不 变性 分 析 各 项 拟 合 指数 


模型 & RMSEA; RMSEA CFI  ARMSEA ACH Ay Adf p(Ax’) 
ESTEE) 0.044 0.068 0.042 0.991 

形态 不 变性 ( 女 ) 0.051 0.073 0.055 0.981 

形态 不 变性 0.048 0.987 

单位 不 变性 0.017 0.074 0.0046 0.986 0.002 0.001 8.352 6 0.213 

截 距 不 变性 0.006 0.043 0.042 0.987 0.004 0.001 3.439 6 0.752 

潜 均 值 不 变性 0.017 0.130 0.043 0.986 0.001 0.001 5.373 2 0.068 
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由 
趣 的 潜 均值 不 变性 分 析 无 法 进行 。 如 果 研究 者 想 要 跳 过 截 距 相等 限制 的 模型 ,在 载荷 不 变 成 
立 之 后 直接 检验 潜 均值 是 否 跨 组 不 变 ， 可 以 使 用 投影 法 (操作 方法 见 附录 )。 本 例 结果 表明 
基于 投影 法 的 传统 测量 不 变性 分 析 中 ， 公 分 数 跨 组 不 变 模型 对 应 的 Ax? 不 显著 (p=0.508)， 结 
支持 潜 均 值 不 变 。 基 于 投影 法 的 等 效 性 检验 中 ， 公 分 数 跨 组 不 变 模型 对 应 的 
= RMSEA;-0.129, RMI 95% 的 置信 和 度 认为 ， 令 公分 数 跨 组 不 变 造成 的 误 设 不 超过 0.129, 
m 由 于 这 个 上 限 已 经 超过 了 经 验 临界 值 ， 因 此 潜 均值 不 变性 未 得 到 支持 。 

上 述 多 个 结果 均 显示 传统 方法 和 等 效 性 检验 对 潜 均 值 是 否 不 变 结论 矛盾 , 我 们 可 以 通过 
检验 两 组 洪 均 值 差异 是 否 统计 显著 来 验证 哪 种 结果 更 合理 ,结果 无 论 是 认 知 共 情 还 是 情绪 共 
情 因子 ， 潜 均值 差异 (标准 化 解 分 别 为 0167 和 0.166) 都 统计 显著 (os<0.05)， 女 生得 分 高 于 4 


于 截 距 不 变性 条 件 苛 刻 ， 经 常 不 能 被 满足 (Svetina et al., 2020)， 这 导致 研究 者 更 感 兴 


FF 


^E, 这 也 符合 相关 理论 和 实证 研究 的 结论 (如 LER, IARE, 2018; Wang et al., 2017). Kit 
明 潜 均值 相等 实际 上 不 成 立 ， 等 效 性 检验 给 出 了 正确 的 判断 ， 而 传统 方法 结果 错误 。 此 外 ， 
等 效 性 检验 不 变性 分 析 的 每 一 步 都 能 告诉 研究 者 可 能 的 误 设 程度 和 统计 推断 犯错 误 的 概率 ， 


而 传统 方法 则 缺乏 信息 量 。 综 合 以 上 结果 , 本 文 的 应 用 实例 也 显示 出 相 比 于 传统 的 模型 评价 


方法 ， 等 效 性 检验 更 具 优 势 。 


6 讨论 

本 文 从 结构 方程 传统 拟 合 指数 的 不 足 入 手 , 详细 介绍 了 等 效 性 检验 这 种 新 的 拟 合 评价 方 
法 , 并 用 实际 数据 演示 了 如 何 用 等 效 性 检验 进行 单个 模型 拟 合 评价 和 测量 不 变性 检验 , 说 明 
了 等 效 性 检验 相对 于 传统 方法 的 优势 (提供 更 多 的 信息 和 更 准确 的 结果 ) 。 但 本 文 仍 有 一 些 相 
关 问 题 需要 深入 讨论 和 拓展 。 
6.1 等 效 性 检验 应 用 于 其 它 拟 合 指数 

前 文 主要 介绍 了 如 何以 RMSEA 的 形式 定义 误 设 程度 。 除 此 之 外 , 用 类 似 的 办 法 也 可 以 
以 其 它 常用 的 拟 合 指数 来 定义 误 设 。 如 Yuan 等 人 (2016) 提 出 用 公式 Turca (e) Rl. Tcoz(em) 
来 计算 s, 和 sx( 下 标 i 表示 独立 模型 )， 进 而 求 得 CFI=1-(ayen)。 传 统 的 CFI 估计 值 不 能 告诉 我 
们 它 偏离 总 体 CFI 值 多 远 ， 而 CFL 可 以 。 比 如 ， 前 文 应 用 实例 中 ， 共 情 两 因子 模型 的 
CEFIL=0.975， 这 一 结果 说 明 我 们 有 95% 的 置信 度 认 为 CFI 真 值 高 于 0.975。 目 前 CFI, 可 以 通 
过 Marcoulides 和 Yuan (2017) 编 写 的 R 函数 计算 ， 只 需要 输入 样本 容量 、 变 量 个 数 、 理 论 模 


型 的 刀 统 计量 和 自由 度 、 独 立 横 型 的 好 统 计量 、 以 及 xc 取 值 即 可 (语句 下 载 网 址 : 


http://www3.nd.edu/~kyuan/EquivalenceTesting/T-size RMSEA. CFI.R). 
除了 RMSEA 和 CFI, SRMR 也 是 一 种 广 受 推荐 的 拟 合 指数 ， 不 过 ， 由 于 该 指数 并 不 基 
于 卡 方 或 非 中 心 参数 ， 且 其 分 布 是 未 知 的 (Kelloway, 2015), 不 容易 像 RMSEA 和 CFI 那样 改 
造成 等 效 性 检验 的 形式 。 将 等 效 性 检验 的 思想 融入 SRMR 是 未 来 研究 可 以 尝试 的 工作 。 
6.2 拟 合 临界 值 
前 文 应 用 实例 中 评价 拟 合 水 平 所 对 照 的 临界 值 仍然 是 传统 临界 值 ， 即 RMSEA 不 高 于 
0.08 和 CFI 不 低 于 0.90 表示 模型 拟 合 可 以 接受 。Yuan 等 人 (2016) 认 为 如 果 等 效 性 检验 仍然 
采用 这 个 标准 ， 会 过 于 严格 ，RMSEA, 和 CFL 需 要 新 的 临界 值 标准 。 他 们 通过 十 余 个 和 
RMSEA, CF 有 关 的 变量 建立 回归 方程 来 预测 RMSEA, 和 CFL。 以 测定 系数 尺 最 大 为 标准 
确定 最 佳 预测 变量 ， 并 将 因 变 量 预 测 值 作为 RMSEA, 和 CFL 的 校正 临界 值 ， 用 RMSEA。 和 
CFIe 表 示 。 校 正 临界 值 比 传统 的 标准 宽松 ， 会 随 着 组 数 、 样 本 容量 和 自由 度 的 变化 而 变化 


(Finch & French, 2018)。 新 的 临界 值 可 以 利用 Marcoulides 和 Yuan(2017) 提 供 的 及 函数 获得 (下 


载 网 址 : http://www3.nd.edu/~kyuan/EquivalenceTesting/CFI_e.R 和 


http://www3.nd.edu/-kyuan/EquivalenceTesting/RMSEA e.R), RMSEA。 也 可 以 利用 equaltestMI 


包 的 adjRMSEA = TRUE 命令 获得 。 


尽管 新 临界 值得 到 一 些 研究 者 的 支持 (如 Finch & French, 2018; Marcoulides & Yuan, 


2017; Yuan et al., 2016), 但 要 注意 RMSEA。 和 CFI 的 提出 并 没有 充分 的 理论 根据 ,同样 是 带 
有 主观 性 的 临界 值 , 而 且 CFIe 的 计算 公式 的 预测 误差 最 大 接近 0.03(Yuan et al., 2016). 此外， 
Counsell 等 人 (2020) 最 近 的 模拟 研究 显示 ， 在 进行 测量 不 变性 分 析 时 ， 对 照 传统 拟 合 临界 值 
的 等 效 性 检验 可 以 较 精确 地 控制 第 一 类 错误 ， 且 统计 检验 力也 在 合理 范围 , 而 使 用 校正 临界 
值 的 等 效 性 检验 的 第 一 类 错误 率 总 是 偏 高 , 且 在 样本 容量 低 于 2000 时 ,几乎 总 是 10 倍 于 使 
用 传统 临界 值 的 等 效 性 检验 。 因 此 ， 尽 管 多 篇 文章 推荐 使 用 ， 本 文 仍 建议 应 用 研究 者 慎 用 校 
正 临 界 值 。 

3 结合 多 种 指标 评价 模型 拟 合 

尽管 等 效 性 检验 在 评价 结构 方程 模型 拟 合 和 测量 不 变性 时 展现 出 了 优 于 对 应 的 传统 拟 
合 指数 (如 RMSEA, 对 应 于 RMSEA) 的 性 质 ，Yuan 等 人 (2016) 还 建议 将 等 效 性 检验 作为 评价 
模型 拟 合 指数 的 惯例 报告 内 容 ,， 但 其 并 非 没 有 局 限 。 首 先 ， 等 效 性 检验 通常 以 RMSEA 的 形 
式 衡 量 误 设 , 而 RMSEA 本 身 就 有 一 定局 限 。 如 当 自 由 度 小 、 样 本 容量 小 或 测量 条 目 较 多 (如 
30 以 上 ) 时 ，RMSEA 容易 拒绝 正确 的 模型 (Shi et al., 2019)， 有 研究 甚至 建议 样本 容量 


\ 于 


200 时 不 要 报告 RMSEA(Taasoobshirazi & Wang, 2016)。 考 虑 到 不 同 的 拟 合 指数 实际 上 是 从 
不 同 的 角度 反应 了 模型 拟 合 ， 如 RMSEA 是 基于 卡 方 的 绝对 拟 合 指数 ，CFI 评价 了 假设 模型 
比 独立 模型 改善 的 程度 ， 而 SRMR 则 是 少 有 的 直接 基于 残 差 的 拟 合 指数 ， 同 时 报告 多 个 拟 
合 指数 应 该 比 单纯 依赖 于 某 个 拟 合 指数 更 能 够 有 效 地 反映 模型 拟 合 ( 温 涵 ， 梁 韵 斯 , 2015), JS 
管 某 些 拟 合 指数 当前 还 无 法 与 等 效 性 检验 结合 起 来 .未 来 的 研究 也 应 该 进一步 比较 等 效 性 检 
验 与 这 些 未 关联 等 效 性 检验 的 拟 合 指数 ， 如 比较 RMSEA, 和 SRMR， 从 而 为 研究 者 选择 合 
适 的 拟 合 指数 评价 模型 提供 更 多 指导 
第 二 , 单纯 依靠 拟 合 指数 评价 模型 是 不 够 的 ,特别 是 决定 拟 合 指 数 取 值 的 因素 很 多 ， 拟 
合 指 数 所 反映 的 并 不 仅仅 是 模型 拟 合 (Moshagen & Auerswald, 2018)。 比 如 所 谓 的 信 度 悖 论 
(Reliability Paradox; Hancock & Mueller, 2011) 一 一 其 它 条 件 不 变 时 , 因子 载荷 越 低 ( 信 度 越 低 ) 
的 模型 常常 拟 合 越 好 ， 因 子 载荷 越 高 ( 信 度 越 高 ) 的 模型 常常 拟 合 越 差 一 一 就 体现 了 拟 合 指数 
反应 模型 质量 的 片面 性 。 因 此 ， 尽 管 等 效 性 检验 优化 了 模型 拟 合 指数 ， 我 们 在 评价 模型 时 ， 
仍然 应 当 综 合 考 虑 多 种 指标 ， 如 检查 路 径 系 数 、 检 视 载 荷 或 RR 、 检 视 修 正 指数 、 检 视 残 差 
ERE SE (TE MBE, 伐 杰 泰 , 2008; 吴 明 隆 , 2010). 
6.4 用 等 效 性 检验 灵活 检验 测量 不 变性 

虽然 使 用 equaltestMI 评价 测量 不 变性 非常 便利 ， 可 以 一 步 完 成 所 有 不 变性 检验 步 又， 
但 这 样 的 设 定 一 定 程度 上 牺牲 了 测量 不 变性 检验 的 灵活 性 。 比 如 , 在 多 组 比较 时 ， 有 些 跨 组 
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不 变 很 难 完 全 满足 (包括 截 距 不 变性 、 误 差 方 差 不 变 性 等 )， 这 时 可 以 考虑 建立 部 分 跨 组 不 变 
(Partial Invariance) 的 模型 ， 即 允许 个 别 不 满足 不 变性 标准 的 参数 自由 估计 ， 仅 使 用 满足 不 变 


性 要 求 的 指标 进行 后 续 更 严格 的 检验 。equaltestMI 无 法 建立 这 样 的 模型 ， 此 时 可 以 先 通过 


Mplus 建立 部 分 跨 组 不 变 的 模型 , 获得 当前 模型 与 上 一 步 模型 的 如 及 自由 度 差 值 , 加 上 组 数 、 


每 组 样本 容量 及 a 水 平等 参数 ,可 以 代入 Yuan 和 Chan(2016) 提 供 的 函数 ( 见 附录 ) 检 验 不 变性 。 


6.5 其 它 需要 讨论 的 问题 


(1) 本 文 从 统计 原理 的 角度 说 明了 等 效 性 检验 在 评 f 


J 


时 的 优势 ， 也 列举 了 一 些 有 关 测 量 不 变 怕 


介 单个 模型 拟 合 以 及 测量 不 变性 分 析 
分 析 的 模拟 研究 和 实证 研究 证 据 ( 包 括 本 文中 的 应 
用 实例 演示 )。 不 过 ， 目 前 还 没有 很 多 研究 比较 等 效 性 检验 和 传统 的 拟 合 指数 在 评价 单个 模 
型 时 的 实际 表现 ,只 有 一 项 基于 单个 模拟 数据 集 ( 真 模型 为 两 因子 模型 ) 的 研究 (Marcoulides & 


Yuan, 2017)， 结 果 发 现 传统 拟 合 指数 会 错误 地 将 单 因 子 模型 当做 拟 合 良好 的 模型 ， 而 等 效 性 
检验 则 发 现 了 单 因 子 模型 拟 合 一 般 。 未 来 还 是 需要 模拟 研究 来 系统 地 比较 两 种 方法 评价 单个 


模型 拟 合 的 优 劣 。 


(2) 当 前 等 效 性 检验 在 结构 方程 领域 的 应 用 均 基于 正 态 性 假设 (Yuan et al., 2016)， 如 果 数 


据 不 服从 多 元 正 态 假设 , 等 效 性 检验 表现 如 何 尚未 可 知 ， 需 要 进一步 研究 。 对 总 体 服从 正 态 
分 布 的 数据 进行 正 态 转换 或 采用 bootstrap 方法 是 可 以 考虑 的 思路 。 
(3) 本 文 评介 了 等 效 性 检验 在 结构 方程 领域 的 应 用 ， 除 了 结构 方程 建 模 ， 等 


可 以 应 用 在 其 它 以 接受 传统 零 假设 为 目标 的 分 析 当 
量 之 间 无 相关 (Shiskina et al., 2018). 方差 齐 改 


的 统计 性 质 。 相信 随 着 更 多 基于 等 效 性 检验 的 实证 和 方法 研究 的 出 现 , 等 效 性 检 


越 多 的 应 用 。 
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附录 : 


投影 法 原理 介绍 


在 传统 的 测量 不 变性 检验 中 ， 均 值 结构 涉及 截 距 项 和 洪 均 值 。 截 距 项 y?' 需 要 设 为 跨 组 不 变 的 ， 从 而 使 


得 潜 均 值 z=E(e)) 可 以 被 识别 和 估计 (E60 是 个 因子 组 成 的 向 量 )。 为 了 回避 这 个 假设 ，Deng 和 Yuan(2016) 


提出 将 观测 变量 分 解 为 公分 数 、 


特殊 因子 和 测量 误差 。 公 式 如 下 : OAO, j=.. m, AOE pA 


分 数组 成 的 向 量 ，uW 是 p 个 特殊 因子 组 成 的 向 量 ，e? 是 p AMERRE, EOE, Eu], 


EleW]=0。 上 述 公 式 形式 上 看 起 来 很 像 传 统 的 潜 均 值 不 变 改 


和 测量 误差 是 分 离开 来 的 ，5W=uW+eW， 第 二 ， 


异 。 首 先 ， 对 于 传统 的 测量 不 变性 公式 ，50 是 特殊 因子 和 测量 误差 的 混合 所 


假设 公分 数 空间 和 特殊 因 


H 


EASE xy AO CO, j-1,.. m, ERREFE 


量 ， 而 对 于 投影 法 ， 特 殊 因 子 


是 更 重要 的 一 点 ， 传 统 的 潜 均 值 不 变性 的 公式 


TEEI, 


而 投影 法 的 公式 当中 没有 截 距 项 ， 所 以 用 投影 法 评价 潜 均 值 不 变性 不 需要 以 截 距 跨 组 不 变 为 前 提 。 
子 空间 正 交 ， 因 子 的 的 公分 数 均值 间 的 比较 是 独立 于 特殊 因子 ug 的 。 在 投 


Bak, x0 的 均值 结构 可 以 分 解 为 ， J 中 = uP ey, pO LAE OT E(XOYERE TE I RIT 8 [RI FO BLA 


而 v0 是 up0 投 影 在 特殊 因子 空间 的 部 分 。 令 人 为 估计 出 的 因子 载荷 矩阵 ， 款 0) 是 第 7 个 组 的 样本 均值 。 通 


过 将 中 投影 到 人 的 列 空间 可 


5j A 正 交 的 空间 ， 可 以 获得 特殊 


ji 


>H 


以 获得 公 


子 均 分 估计 值 ， 将 其 标记 为 应) 。 相 似 地 ， 通 过 将 副 7) 投影 到 


因子 估计 均值 ， 将 其 标记 为 2) , We x - aU 90 。 公 因子 和 特殊 


子 均 分 仅 依赖 于 样本 均值 和 估计 出 的 公 因子 载荷 矩阵 ， 不 会 涉及 到 和 截 距 项 的 估计 。 


基于 投影 法 的 传统 潜 均值 测量 不 变性 分 析 的 零 假 设 为 瓦 : xU =) -KO = 0 22, m. x ut 


服从 正 态 分 布 ,这 个 假设 可 以 


J 统计 量 Teis=NF els 来 检验 o Tuis 近似 服从 一 个 H 


如 果 用 等 效 性 检验 做 投影 法 , W 


前述 


FERN dfe-(m-Vyk 的 卡 方 分 布 。 


段 设 修 改 为 He: Fgiso>€05 Faiso 是 Fats 的 总 体 值 (Jiang et al., 2017). 评价 


Tas 显著 性 的 临界 值 是 x2(60) 的 左 侧 累积 概率 ，60=Neo。 当 Tes 小 于 临界 值 ， 我 们 拒绝 Hs。 我 们 也 可 以 通 


过 RMSEA o=(e0/dfx)!? 3 Wt XE £o; 


All 


] RMSEA, 来 检验 Here 


H R BY equaltestMI 包 分 析 测 量 不 变性 的 语句 模板 


install.packages(“lavaan”) #2248 lavaan 程序 包 ， 因 为 equaltestMI 包 的 模型 设 定 是 基于 lavaan 的 


install._packages(“equaltestMI”) #2238 equaltestMI 程序 包 
library(equaltestMI) # 加 载 equaltestMI 包 


etdata<-read.csv("C:/Users/admin/Desktop/ 共 情 .CSV", header=F) 


# 导 入 数据 文件 ， 并 命名 为 etdata， 做 自己 的 分 析 需 将 上 述 路 径 蔡 换 为 自己 的 数据 文件 路 径 


#header=F 表示 数据 文件 未 含 变 量 名 


names(etdata)[1:9]<-c("gender","E1","E2","E3","E4","E5","E6","E7","E8") # 变 量 命名 ， 相 当 于 Mplus 中 的 


variables 模块 下 的 “names=” 命 令 
Emodel<- 'CE =~ El + E2 + E3 + E4 


AE =~ E5 + E6 + E7 + E8' 


# 构 建 测 


E 


模型 ， 模 型 命名 为 Emodel，CE 为 认 知 共 情 ，AE 为 情绪 共 情 ，E1~ E8 是 量 表 条 目 ，“=~” 相 当 


T Mplus 中 的 “by” 命 令 

test <- eqMI.main(model = Emodel, data = etdata, 
group = "gender", meanstructure = TRUE, 
output = 'both', quiet = FALSE, 
equivalence.test = TRUE, adjRMSEA = FALSE, 


projection = TRUE, bootstrap = FALSE) 


#model 代入 模型 名 ，data 代入 数据 名 ，group 代入 分 组 变量 即 gender; meanstructure- TRUE 表示 包含 均值 


用 校正 的 RMSEA 临界 值 即 RMSEA., 如 需 使 用 校正 临界 值 , 将 FALSE 


HB 


结构 ; adjRMSEA =FALSE 表示 不 


H 


o 


改 为 TRUE 即 可 ; projection = TRUE 表示 采用 投影 法 分 析 潜 均值 不 变性 


iE: 如 需 获 取 单 个 模型 评价 的 校正 临界 值 RIMSEA。， 可 通过 equaltestMI 包 的 eqMI.RMSEA 命令 ， 如 : 


eqMI.RMSEA(N = 856, m= 1, df= 19)。 组 数 m 必须 指定 为 1。 


用 Yuan 和 Chan(2016) 的 R 函数 获取 测量 不 变性 分 析 需 要 的 RMSEA, 


alpha=.05;N_1=487; N_2=369;N=N_1+N_2;m=2;T_ml=3.439;df=6; 


MN 


# 输 入 显著 性 水 平 、 各 组 样本 容量 、 组 数 及 约束 模型 和 上 一 步 模型 的 卡 方差 值 及 自由 度 差 值 ， 如 果 需 要 做 部 


分 不 变性 分 析 ， 可 以 先 利 用 Mplus 获取 上 述 参数 ， 然 后 输入 此 函数 


ncp=ncp_chi2(alpha=alpha, T=T_ml, df=df, m=m, N=N); 


# 输 出 非 中心 参 数 ， 此 句 不 要 改动 
RMSEA ctoa(m=m, N_sample=N, df=df); 


# 输 出 RMSEA,， 此 句 不 要 改动 


TE: 篇 幅 所 限 ， 上 述 语 句 只 涉及 需要 使 用 者 输入 的 参数 ， 而 省 略 了 ncp chi2 函数 和 RMSEA_ctoa 函数 的 


k 内容， 感 兴趣 的 读者 需 在 Yuan 和  ChanQOl6) 提供 的 网 址 


(http:/www3.nd.edu/~kyuan/mgroup/Equivalence-testing.R) 下 载 完整 语句 ， 方 可 运行 程序 。 
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Abstract: There are some limitations in the commonly used fit indices of structural equation 
model. For example, 7”, which is set up to reject the traditional null hypothesis, cannot be used to 
endorse a model, while descriptive fit indices such as RMSEA and CFI do not have inferential 
statistical properties. Equivalence testing can effectively compensate for the limitations mentioned 
above. In this paper, the way to use equivalence testing in evaluating the fit of a single model and 
its difference from the null hypothesis testing were introduced first. Then the approach to analyze 
measurement invariance by equivalence testing was described. Furthermore, empirical data was 
used to demonstrate the effectiveness of equivalence testing in single model evaluation and 
measurement invariance test, and to compare equivalence testing with traditional model evaluation 
method. 
Key words: structural equation model; fit indices; equivalence testing; null hypothesis testing; 


measurement invariance 


